1.17. Аудио и видео
Аудио — это цифровое представление звуковых волн, которые преобразуются в последовательность битов для хранения и воспроизведения. Звуковые волны, изначально аналоговые, проходят через процесс оцифровки, где они разбиваются на дискретные значения с помощью АЦП (аналого-цифрового преобразователя). Этот процесс определяется двумя ключевыми параметрами - частотой дискретизации (количество выборок в секунду) и разрядностью (глубина битов на выборку). Например, стандарт CD-качества использует частоту дискретизации 44.1 кГц и разрядность 16 бит, что обеспечивает высокую точность воспроизведения звука.
Сжатие аудио данных может быть как с потерями, так и без них. Форматы с потерями (MP3, AAC) удаляют «несущественные» частоты, которые человеческое ухо не воспринимает, чтобы уменьшить размер файла. Это делает их идеальными для потоковой передачи и хранения музыки. Однако для профессиональной записи используется несжатый формат WAV, который сохраняет все детали звука, но требует значительного объёма памяти. При редактировании аудио важно понимать, что каждая операция, будь то обрезка, нормализация или добавление эффектов, может повлиять на качество звука. Например, нормализация увеличивает громкость до максимального уровня без искажений, а удаление шумов помогает очистить запись от фоновых помех.
Видео — это последовательность статических изображений (кадров), которые воспроизводятся с определённой частотой для создания иллюзии движения. Каждый кадр состоит из пикселей, которые содержат информацию о цвете и яркости. Частота кадров (FPS, Frames Per Second) определяет, сколько кадров отображается за одну секунду. Стандартные значения FPS варьируются от 24 (кино) до 120 (игры и высококачественное видео). Видео также может быть прогрессивным (каждый кадр полностью отрисовывается) или чересстрочным (кадры разделены на чётные и нечётные строки).
Кодирование видео — это процесс сжатия данных для уменьшения размера файла. Современные кодеки, такие как H.264 и H.265, используют сложные алгоритмы для анализа изменений между кадрами и сохранения только различий. Это значительно снижает объём данных, сохраняя высокое качество изображения. Например, H.265 (HEVC) предлагает вдвое лучшее сжатие по сравнению с H.264 при том же качестве. Однако более эффективные кодеки требуют больше вычислительных ресурсов для кодирования и декодирования.
Битрейт (Bitrate) – количество бит, передаваемых или обрабатываемых за секунду (измеряется в кбит/с или Мбит/с):
Аудио:
- 128 кбит/с (MP3, среднее качество);
- 320 кбит/с (MP3, высокое качество);
- 1411 кбит/с (CD-качество, несжатый WAV).
Видео:
- 5 Мбит/с (HD 720p, YouTube);
- 15 Мбит/с (Full HD 1080p);
- 50 Мбит/с (4K, Blu-ray).
Типы битрейта:
- CBR (Constrant Bitrate) – постоянный (подходит для стриминга);
- VBR (Variable Bitrate) – переменный (лучшее качество при меньшем размере).
Битрейт - ключевой параметр, определяющий качество аудио и видео. Он показывает, сколько данных передаётся или обрабатывается за секунду. Высокий битрейт означает большее количество информации, что приводит к более качественному воспроизведению. Однако это также увеличивает размер файла. Например, аудиофайл с битрейтом 320 кбит/с будет звучать лучше, чем файл с битрейтом 128 кбит/с, но займёт в два с половиной раза больше места.
Типы битрейта, такие как CBR (постоянный) и VBR (переменный), имеют свои преимущества. CBR подходит для стриминга, так как обеспечивает стабильный поток данных, в то время как VBR адаптируется к сложности контента, предоставляя лучшее качество при меньшем размере файла. Например, в сложных сценах видео с быстрым движением VBR увеличивает битрейт для сохранения деталей, а в статичных сценах снижает его.
Потоки (Streams)
Аудио и видео состоят из потоков данных:
- Аудиопоток (например, AAC, MP3);
- Видеопоток (например, H.264, VP9);
- Субтитры (текстовый поток).
Потоки работают вместе для создания мультимедийного контента. Видеопоток содержит изображение, аудиопоток - звук, а дополнительные потоки могут включать субтитры и метаданные. Например, формат MKV позволяет объединять несколько видеопотоков (например, основной фильм и альтернативные ракурсы) и аудиопотоков (оригинальная дорожка, перевод, комментарии).
Контейнеры, такие как MP4 или AVI, служат «обёрткой» для этих потоков, обеспечивая их синхронизацию. При воспроизведении медиаплеер декодирует каждый поток отдельно. Видеокодек преобразует данные в кадры, аудиокодек - звук, а субтитры выводятся поверх видео. Понимание потоков важно для правильного выбора формата и настройки параметров при записи или конвертации.
Кодеки — это программы или алгоритмы, которые кодируют и декодируют аудио и видео. Кодирование — это процесс сжатия данных для уменьшения размера файла, а декодирование - обратный процесс, восстанавливающий данные для воспроизведения. Современные кодеки используют сложные алгоритмы для достижения высокой эффективности сжатия. Для аудио кодеки (к примеру, AAC и FLAC) предлагают разные подходы - AAC обеспечивает высокое качество при малом размере, а FLAC сохраняет все детали звука без потерь.